#!/usr/bin/env python
#coding:utf-8

"""
图片验证码的处理: 参考 https://www.cnblogs.com/zhongtang/p/5560361.html

py的一种图像处理库: Tesseract

    将图像翻译成文字称为光学文字识别(Optical Character Recognition OCR)

    Tesseract是一个OCR库,可以识别任何字体及Unicode字符

"""

from PIL import Image
import pytesseract


#image_data = Image.open("english.jpg")
image_data = Image.open("排序算法.png")

#这里略过对图片的阈值过滤然后对过滤后的文件进行OCR识别

text = pytesseract.image_to_string(image_data, lang="chi_sim")

print(text)

